1
La mutation vers l'architecture GPU à usage général
AI032Lesson 12
00:00

Le passage du NVIDIA GT200 au architecture Fermi marque la naissance de la troisième génération de calcul GPU. Alors que les architectures précédentes étaient des unités centrées sur les graphiques « adaptées » pour le calcul, Fermi a été conçu dès le départ pour GPGPU (GPU à usage général) applications.

1. Du centrage sur les graphiques au centrage sur le calcul

Contrairement au GT200, qui se concentrait sur les unités de textures et la parallélisation rigide des données, Fermi a introduit un chemin unifié pour les demandes de mémoire. Ce changement a permis Pensée computationnelle, permettant aux développeurs d'aller au-delà des cartographies simples en grille 2D vers des algorithmes C++ complexes.

GT200 : Évolution graphiqueUnités de texture uniquementPas de cache unifiéMémoire partagée manuelle uniquementFermi : Révolution GPGPUCache L2 unifiéSM avec cache L1FP64 IEEE 754-2008

2. Le bond dans la hiérarchie de mémoire

Fermi a introduit une véritable hiérarchie de cache L1/L2 et conformité avec IEEE 754-2008 des normes en virgule flottante. Cela signifiait que les chercheurs n'avaient plus besoin de gérer manuellement la mémoire tampon (mémoire partagée) pour chaque octet, ce qui permettait des structures de données irrégulières et une précision en double précision adaptée à l'ingénierie scientifique.

main.py
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>